实体分辨率是一个广泛研究的问题,有几个提案可以匹配关系的记录。匹配文本内容是许多应用程序中的广泛任务,例如问题应答和搜索。虽然最近的方法实现了这两个任务的有希望的结果,但没有明确的解决方案对于匹配文本内容和结构化数据的更一般性问题。我们介绍了一个框架,支持这项新任务,在任何一对语料库,是关系表或文本文档的无监督环境中。我们的方法在Corpora的内容上构建了一个细粒度的图表,并派生了Word Embeddings以表示要在低维空间中匹配的对象。学习的表示使得能够以不同的粒度与文本句子和段落的相关粒度有效和有效地匹配。我们灵活的框架可以利用预先训练的资源,但它不依赖于它们的存在,并且当词汇表是特定的域时,匹配内容的更好的质量性能。我们还使用“展开和压缩”方法在图形创建过程中引入优化,该方法首先识别跨元素的新有效关系,以改善匹配,然后修剪节点和边,以减少图表大小。实际用例和公共数据集的实验表明,我们的框架在结果'质量和在执行时间内,我们的框架产生了优于嵌入嵌入和微调语言模型的嵌入品。
translated by 谷歌翻译
Individual particle rotation and displacement were measured in triaxial tests on transparent sand stabilized with geogrid simulants. The Cellpose U-Net model, originally developed to segment biological cells, was trained to segment images of fused quartz particles. The Score-CAM metric from the field of Explainable AI was used to validate the application of Cellpose to segment particles of fused quartz. These segmented particles were characterized in terms of Fourier shape descriptors and tracked across images. The measured particle displacements in the monotonic triaxial tests correlated with displacement fields from Digital Image Correlation (DIC). In contrast to DIC, the new technique also allows for the measurement of individual particle rotation. The particle rotation measurements were found to be repeatable across different specimens. A state boundary line between probable and improbable particle motions could be identified for a given test based on the measured particle displacements and rotations. The size of the zone of probable motions was used to quantify the effectiveness of the stabilizing inclusions. The results of repeated load tests revealed that the honeycomb inclusions used stabilized the specimens by reducing both particle displacements and rotations.
translated by 谷歌翻译
真实的人类对话数据是复杂,异质和嘈杂的,从该数据中构建开放域对话系统仍然是一项艰巨的任务。实际上,此类对话数据仍然包含大量信息和知识,但是,它们没有得到充分探索。在本文中,我们展示了现有的开放域对话生成方法,这些方法记住上下文响应配对的数据,并使用自动回归或编码模型模型不利于培训数据。与当前的方法不同,使用外部知识,我们探索了一个检索生成培训框架,该培训框架可以通过将它们视为“证据”来利用异质和嘈杂的培训数据。特别是,我们使用Bertscore进行检索,这给出了证据和一代的更好品质。公开可用数据集的实验表明,我们的方法可以帮助模型产生更好的响应,即使此类培训数据通常会留下深刻的印象为低质量数据。这种性能增益与通过扩大训练组更好的改进的绩效增益相当,甚至更好。我们还发现,模型性能与检索到的证据的相关性有正相关。此外,我们的方法在零拍实验上表现良好,这表明我们的方法对现实世界数据可能更强大。
translated by 谷歌翻译
我们通过在调整方案中找到有效的相似性测量,提出了一种朝向弦景观的真空退化问题的新方法。使用一百万个Calabi-yau歧管作为具体例子,少量机器学习和暹罗神经网络的范式代表它们作为R(3)的点,其中两个歧管之间的相似度得分是它们之间的欧几里德距离r(3)代表。使用这些方法,我们可以通过仅在几百个数据点上进行培训,将搜索空间压缩以获得极度罕见的歧管,以百分比在原始数据的一个百分比内。我们还展示了如何应用这些方法来表征真空代表的“典型性”。
translated by 谷歌翻译
安装在微空中车辆(MAV)上的地面穿透雷达是有助于协助人道主义陆地间隙的工具。然而,合成孔径雷达图像的质量取决于雷达天线的准确和精确运动估计以及与MAV产生信息性的观点。本文介绍了一个完整的自动空气缩进的合成孔径雷达(GPSAR)系统。该系统由空间校准和时间上同步的工业级传感器套件组成,使得在地面上方,雷达成像和光学成像。自定义任务规划框架允许在地上控制地上的Stripmap和圆形(GPSAR)轨迹的生成和自动执行,以及空中成像调查飞行。基于因子图基于Dual接收机实时运动(RTK)全局导航卫星系统(GNSS)和惯性测量单元(IMU)的测量值,以获得精确,高速平台位置和方向。地面真理实验表明,传感器时机为0.8美元,正如0.1美元的那样,定位率为1 kHz。与具有不确定标题初始化的单个位置因子相比,双位置因子配方可提高高达40%,批量定位精度高达59%。我们的现场试验验证了本地化准确性和精度,使得能够相干雷达测量和检测在沙子中埋入的雷达目标。这验证了作为鸟瞰着地图检测系统的潜力。
translated by 谷歌翻译